English

语音识别技术离我们有多远

2000-09-20 来源:光明日报 IBM中国研究中心 沈丽琴 博士 我有话说

IBM在去年年底发布的电话语音识别技术可以使许多商家的服务更周到,更多的电话用户受益。有了这项技术,各种信息查询、飞机订票、旅馆预定等都可以实现自动化。利用IBM的语音识别技术通过电话上网,用户只需说出你想得到的网上信息,机器就会自动识别,将你的请求送到互联网上,并把返回的相关信息用语音合成技术回放给你,为用户提供人性化的语音应答交互界面。这样,众多的电话用户就可以享受到网上信息服务。

越来越多的掌上设备正慢慢成为许多人的生活和工作必备品,比如手机、电子记事本,IBM的WorkPad等。这些小的设备或者没有键盘,或者只有简单的数字键,输入和各种操作都十分不便。如果能用人们觉得最自然的方式———语音进行控制,人们将更加青睐这些灵巧的伴侣。IBM公司将已经在高端计算机上发展的语音技术进行简化,抽取其中的核心技术,研制出用于这类低端设备的识别引擎,并在市场中的某些掌上电脑上成功建立了实用的原型系统,证明了技术的可行性。相信在不久的将来,人们完全可以用语音操作手机和各种掌上设备。

为了让人与机器的交流更加自然,我们需要机器不仅能识别准用户说的话,更要理解它,然后去执行相应的动作。比如,用户通过语音订房,要求“订一套10月12日在某某酒店的单人房”。当用语音识别技术识别出这句话后,机器还需要理解客户入住的时间是“10月12日”,酒店是“某某酒店”,房型是“单人房”。然后将这些需求送给系统才能完成预定。这是自然语言理解的技术。目前还不十分成熟,但已初步使用。同时机器必须产生合适的回答把得到的信息(如是否有房,价格等)反馈给用户,或提示用户需要进一步的信息(如请用户提供离店日期等),这就是自然语言产生的技术。产生准确地应答也是一项十分具有挑战性的技术。另外相关的技术还有,在许多应用场合,需要说话人辨识技术,以便通过语音判断说话人是谁,免去用户记忆难记的密码。提供更友好的系统与人的交互界面。

当然,语音识别本身也还没有达到完美,还有许多挑战等待着科学家去一一攻破。比如对不同噪声环境的适应;两种或多种语言夹杂使用的语音识别;或者特别随意的对话识别等等。可以看到,语音识别技术将让我们体会到技术创新给人类带来的轻松和效率。

手机光明网

光明网版权所有

光明日报社概况 | 关于光明网 | 报网动态 | 联系我们 | 法律声明 | 光明网邮箱 | 网站地图

光明网版权所有